android ios benchmark arm inference artificial-intelligence arm-neon mnn deep-learning-framework ncnn tensorflow-lite embedded-ai deep-learning-inference tnn Python

Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow 2ed 2019.epub

标签： Machine Learning Keras TensorFlow Scikit-Learn

Through a series of recent breakthroughs, deep learning has boosted the entire field of machine learning. Now, even programmers who know close to nothing about this technology can use simple, ...

Hands-On Machine Learning with Scikit-Learn and TensorFlow [EPUB]

标签：机器学习 Scikit-Learn TensorFlow

Through a series of recent breakthroughs, deep learning has boosted the entire field of machine learning. Now, even programmers who know close to nothing about this technology can use simple, ...

【论文导读】- E-LSTM-D: A Deep Learning Framework for Dynamic Network Link Prediction（动态网络链接...

标签： lstm encoder-decoder 动态网络

预测网络中节点之间的潜在关系，即链路预测，长期以来一直是网络科学中的一个挑战。然而，大多数研究只关注静态网络的链路预测，而现实世界中的网络总是随着节点和链路的出现和消失而不断演化。...

【强化学习】Q-Learning算法详解

标签：算法强化学习 Q-Learning

1 Q-Learning算法简介 1.1 行为准则我们做很多事情都有自己的行为准则，比如小时候爸妈常说：不写完作业就不准看电视。所以我们在写作业这种状态下，写的好的行为就是继续写作业，知道写完他，我们还可以得到奖励。...

Deep Reinforcement Learning - 1. DDPG原理和算法

标签： RL deep-learning ddpg

Deep Reinforcement Learning - 1. DDPG原理和算法背景描述 DDPG的定义和应用场景 DDPG算法相关基本概念定义 DDPG实现框架和算法 DDPG对于DPG的关键改进下一篇以下用RL作为Reinforcement Learning 的简称。背景...

深入理解深度学习——GPT（Generative Pre-Trained Transformer）：GPT-3与Few-shot Learning

标签：人工智能深度学习自然语言处理

GPT-3曾经是最大、最让人惊艳也是最具争议的预训练语言模型。介绍GPT-3的论文长达72页，...与文章《》中介绍的GPT-2在Zero-shot Learning设置下的惊喜表现相比，GPT-3在Few-shot Learning设置下的性能足以震惊所有人。

深入理解深度学习——GPT（Generative Pre-Trained Transformer）：GPT-2与Zero-shot Learning

标签：人工智能深度学习自然语言处理

GPT-2的不俗表现，证明它是一个极其优秀的预训练语言模型，虽然OpenAI并没有给出GPT-2微调后在各下游任务中的表现，但可以预期的是，其效果一定很好，在监督微调阶段的训练方式与第一代GPT并无差别。

强化学习：Q-learning与DQN（Deep Q Network）

标签：强化学习 Q-learning DQN

Q-learning是一种很常用的强化学习方法，DQN则是Q-learning和神经网络的结合。 Q-learning 首先要设计状态空间s，动作空间a，以及reward。一次transition就是（s，a，w，s_）一次episode就是 DQN Q-...

吴恩达老师deeplearning.ai-全部课件

标签：深度学习

吴恩达老师DeepLearning.ai.系列课程的全部课件都在这里了。

【强化学习】Q-Learning算法求解悬崖行走问题 + Python代码实战

标签： python 强化学习悬崖行走问题

下面仅对Q-Learning算法对简单介绍Q学习是一种异策略（off-policy）算法。目标策略（target policy）和行为策略（behavior policy）。目标策略就是我们需要去学习的策略，相当于后方指挥的军师，它不需要直接与环境...

mastering machine learning with scikit-learn

标签： scikit-learn machine learning

mastering machine learning with scikit-learn

强化学习之Q-Learning

标签：强化学习 reinforcement learning Q-learning

Q-learning是RL最基础的算法，于1989年由Watkins被提出来，与同样经典的SARSA算法非常类似。按木盏习惯，本文依旧不会大量堆公式，尽量以易理解的方式来表达Q-Learning。 1. 查表操作 “查表操作”这四个字...

MAML: Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks (模型无关的元学习用于快速...

标签： Meta-learning Few-shot learning MAML

目录1. 摘要2. 介绍3. 模型3.1 模型架构3.1.1 注意力机制内核3.1.2 完全上下文 ...few-shot learning 问题需要分类器必须识别在每个新类只给出几个样本情况下识别新的类（新的类是指在训练阶段没有见过的类）。文...

Deep Learning with Python: A Hands-on Introduction

标签： Deep Learning Python

深度学习与计算机视觉教程(17) | 深度强化学习 (马尔可夫决策过程,Q-Learning,DQN)（CV通关指南·完结）

标签：人工智能计算机视觉 Q-Learning

本文讲解了强化学习的主要挑战、数学定义及实际应用（制定长期决策、估计或者近似未来奖励、状态过多时估计或者近似未来奖励、从数据中学习模型使其真正工作等）【对应 CS231n Lecture 14】

Improved Deep Metric Learning with Multi-class N-pair Loss Objective论文N-pair loss解读与实现

标签： N-pair loss Improved Deep Metric Learning withM

论文：NIPS2016 Improved Deep Metric Learning with Multi-class N-pair Loss Objective 距离度量学习旨在学习在嵌入空间能够保使得相似数据点靠的近，不相似数据离得远的一种数据嵌入表达技术。得益于深度学习的...

Joint Learning 与 Multi-Task Learning浅析

标签：机器学习集成学习 Joint learning

Joint Learning和Multi-Task Learning都属于集成学习（Ensemble Learning）的范畴，但网上关于Joint Learning的相关资料较少，因此在这里对这两种学习方式进行简要介绍，并对其不同点进行区分。 Joint Learning ...

Python_强化学习_Q-Learning算法_二维迷宫游戏

标签：机器学习强化学习 python

在该项目中，你将使用强化学习算法（本文使用的Q-Learning），实现一个自动走迷宫的机器人。机器人初始位置在地图左上角。在我们的迷宫中，有墙壁（黑色方块）、元宝（黄色圆块）及终点（绿色方块）。机器人要尽...

Deep Q-Learning深度增强学习（代码篇）

标签： tensorflow DQN 增强学习

搭建DQN

【强化学习Q-Learning算法学习笔记】概念整理+实例+代码解释+ppt

标签：机器学习强化学习算法 Q-LEARNING

1.强化学习介绍 2.Q-Learning算法实例 3.一个Q-Learning算法的程序实现

【论文整理】小样本学习Few-shot learning论文整理收藏（最全，持续更新）

标签：小样本学习综述 few-shot 小样本

1.Generalizing from a Few Examples: A Survey on Few-Shot Learning 2.Generalizing from a few examples: A survey on few-shot learning, CSUR, 2020. 3.Rethinkingfew-shotimage classification: a good ...

Meta-learning（元学习与少样本学习）

标签：元学习少样本学习度量学习

Meta-learning（元学习）虽然目前很多暴力堆算力堆数据的模型取得了很好的效果，但由于有些数据很难收集到，或者大量的标注耗费人力太多，关于元学习的研究也很多。特别是比如人类往往只需要通过少量数据就能做到...

用Python走迷宫｜Q-Learning｜强化学习

标签： python 强化学习 Q-Learning

Q-Learning走迷宫上文中我们了解了Q-Learning算法的思想，基于这种思想我们可以实现很多有趣的功能和小demo，本文让我们通过Q-Learning算法来实现用计算机来走迷宫。原理简述我们先从一个比较高端的例子说起，...

完结撒花！吴恩达DeepLearning.ai《深度学习》课程笔记目录总集

标签：吴恩达深度学习 Coursera

吴恩达 Coursera DeepLearning.ai《深度学习》系列课程笔记目录总集

深度强化学习系列(5): Double Q-Learning原理详解

标签： Double Q-Learning Overestimation 过估计

论文地址： ...前言： Q-Learning算法由于受到大规模的动作值过估计(overestimation)而出现不稳定和效果不佳等现象的存在，而导致overestimation的主要原因来自于最大化值函...

论文解析：Deep Reinforcement Learning for List-wise Recommendations

标签：推荐系统强化学习 list-wise

论文解析：Deep Reinforcement Learning for List-wise Recommendations 简介京东在强化学习推荐系统方面的工作，发表在KDD 2019 背景推荐系统存在的问题：无法通过与用户的交互建模用户的动态兴趣变化最大化单...

Learning to Compare: Relation Network for Few-Shot Learning. （学习比较：用于few-shot learning 的...

标签： meta-learning few-shot learning metric learning

目录1. 摘要2. 介绍3....few-shot learning 问题需要分类器必须在每个新类只给出几个样本情况下识别新的类（新的类是指在训练阶段没有见过的类）。文章提出了网络叫做 — 关系网络（Relation Netwo...

Pytorch官方新书 deep-learning-with-pytorch.pdf下载

标签： pytorch deep learning

2019.11.22 pytorh官方终于出书了！！作者是Eli Stevens和Luca Antiga. Eli Stevens，是一名软件工程师，已经在硅谷工作了15年。过去7年中，他在一家开发医疗设备软件的创业公司担任CTO。

深度学习：Q-learning收敛证明

标签： Q-learning收敛证明

Q-learning收敛证明